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GenCore version 6.3 
Copyright (c) 1993 - 2009 Biocceleration Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



September 2, 2009, 13:23:52 ; Search time 5899 Seconds 

(without alignments) 
67685.738 Million cell updates/sec 



Title : 

Perfect score: 
Sequence : 



US-10-506-327-23 

6070 

1 tcaagacatccttgattaag. 



. actattttgggagtgatgtc 6070 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



115145107 seqs, 32888312461 residues 



Total number of hits satisfying chosen parameters: 



230290214 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database 



Pending_Patents_NA_Main : * 

1: /ABSS/Data/CRF/ptodata/ 

2: /ABSS/Data/CRF/ptodata/ 

3: /ABSS/Data/CRF/ptodata/ 

4: /ABSS/Data/CRF/ptodata/ 

5: /ABSS/Data/CRF/ptodata/ 

6: /ABSS/Data/CRF/ptodata/ 

7: /ABSS/Data/CRF/ptodata/ 

8: /ABSS/Data/CRF/ptodata/ 

9: /ABSS/Data/CRF/ptodata/ 

10: /ABSS/Data/CRF/ptodata 

11: /ABSS/Data/CRF/ptodata 

12: /ABSS/Data/CRF/ptodata 

13: /ABSS/Data/CRF/ptodata 

14: /ABSS/Data/CRF/ptodata 

15: /ABSS/Data/CRF/ptodata 



2/pna/PCTUSA_C0MB. seq: ' 
2/pna/PCTUSB_C0MB. seq: ^ 
2/pna/PCTUSC_C0MB.seq: ^ 
2/pna/PCTUSD_C0MB.seq: ^ 
2/pna/US075_COMB . seq : * 
2/pna/US0 76_COMB. seq: * 
2/pna/US077_COMB . seq: * 
2/pna/US078_COMB.seq: * 
2/pna/US079_COMB.seq: * 
/2/pna/US080_COMB. seq: ^ 
/2/pna/US081_COMB.seq: ' 
/2/pna/US082_COMB.seq: ^ 
/2/pna/US083_COMB.seq: " 
/2/pna/US084_COMB.seq: ^ 
/2/pna/US085_COMB.seq: ^ 
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16 : /ABSS/Data/CRF/ptociata/2/pna/US086_COMB.seq: * 

17 : /ABSS/Data/CRF/ptodata/2/pna/US087_COMB. seq: * 

18 : /ABSS/Data/CRF/ptodata/2/pna/US088_COMB. seq: * 

19 : /ABSS/Data/CRF/ptoclata/2/pna/US089_COMB. seq: * 

20: /ABSS/Data/CRF/ptodata/2/pna/US090_COMB.seq: * 

21 : /ABSS/Data/CRF/ptodata/2/pna/US091_COMB.seq: * 

22 : /ABSS/Data/CRF/ptodata/2/pna/US092_COMB. seq: * 

23 : /ABSS/Data/CRF/ptodata/2/pna/US093_COMB.seq: * 

24 : /ABSS/Data/CRF/ptodata/2/pna/US094_C0MB.seq: * 

25: /ABSS/Data/CRF/ptodata/2/pna/US095A_COMB.seq: * 

26 : /ABSS/Data/CRF/ptodata/2/pna/US095B_COMB.seq: * 

27 : /ABSS/Data/CRF/ptodata/2/pna/US095C_COMB. seq: * 

28: /ABSS/Data/CRF/ptodata/2/pna/US096A_COMB.seq: * 

29: /ABSS/Data/CRF/ptodata/2/pna/US096B_COMB.seq: * 

30: /ABSS/Data/CRF/ptodata/2/pna/US096C_COMB.seq: * 

31 : /ABSS/Data/CRF/ptodata/2/pna/US097A_COMB.seq: * 

32 : /ABSS/Data/CRF/ptodata/2/pna/US097B_COMB. seq: * 

33: /ABSS/Data/CRF/ptodata/2/pna/US098A_COMB.seq: * 

34: /ABSS/Data/CRF/ptodata/2/pna/US098B_COMB.seq: * 

35 : /ABSS/Data/CRF/ptodata/2/pna/US099A_COMB. seq: * 

36 : /ABSS/Data/CRF/ptodata/2/pna/US099B_COMB. seq: * 

37 : /ABSS/Data/CRF/ptodata/2/pna/US099C_COMB. seq: * 

38: /ABSS/Data/CRF/ptodata/2/pna/US099D_COMB.seq: * 

39: /ABSS/Data/CRF/ptodata/2/pna/US100_COMB.seq: * 

40 : /ABSS/Data/CRF/ptodata/2/pna/US101_COMB. seq: * 

41 : /ABSS/Data/CRF/ptodata/2/pna/US102A_C0MB. seq: * 

42 : /ABSS/Data/CRF/ptodata/2/pna/US102B_COMB.seq: * 

43: /ABSS/Data/CRF/ptodata/2/pna/US103A_COMB.seq: * 

44: /ABSS/Data/CRF/ptodata/2/pna/US103B_COMB.seq: * 

45 : /ABSS/Data/CRF/ptodata/2/pna/US104_COMB. seq: * 

46 : /ABSS/Data/CRF/ptodata/2/pna/US105_COMB.seq: * 

47: /ABSS/Data/CRF/ptodata/2/pna/US106A_COMB.seq: * 

48: /ABSS/Data/CRF/ptodata/2/pna/US106B_COMB.seq: * 

49: /ABSS/Data/CRF/ptodata/2/pna/US107A_COMB.seq: * 

50 : /ABSS/Data/CRF/ptodata/2/pna/US107B_COMB. seq: * 

51 : /ABSS/Data/CRF/ptodata/2/pna/US107C_COMB.seq: * 

52: /ABSS/Data/CRF/ptodata/2/pna/US107D_COMB.seq: * 

53 : /ABSS/Data/CRF/ptodata/2/pna/US107E_COMB. seq: * 

54 : /ABSS/Data/CRF/ptodata/2/pna/US107F_COMB. seq: * 

55 : /ABSS/Data/CRF/ptodata/2/pna/US107G_COMB. seq: * 

56 : /ABSS/Data/CRF/ptodata/2/pna/US107H_COMB.seq: * 

57: /ABSS/Data/CRF/ptodata/2/pna/US107I_COMB.seq: * 

58 : /ABSS/Data/CRF/ptodata/2/pna/US108_COMB. seq: * 

59 : /ABSS/Data/CRF/ptodata/2/pna/US109A_COMB. seq: * 

60 : /ABSS/Data/CRF/ptodata/2/pna/US109B_COMB. seq: * 

61 : /ABSS/Data/CRF/ptodata/2/pna/US109C_COMB.seq: * 

62: /ABSS/Data/CRF/ptodata/2/pna/US10709577B.seq: * 

63 : /ABSS/Data/CRF/ptodata/2/pna/US107 0957 7B. seq. 2 : * 

64 : /ABSS/Data/CRF/ptodata/2/pna/US1070957 7B.seq.3: * 

65: /ABSS/Data/CRF/ptodata/2/pna/US10709739B.seq: * 

66 : /ABSS/Data/CRF/ptodata/2/pna/US10940892 . seq: * 

67: /ABSS/Data/CRF/ptodata/2/pna/US110A_COMB.seq: * 

68 : /ABSS/Data/CRF/ptodata/2/pna/US110B_COMB. seq: * 

69: /ABSS/Data/CRF/ptodata/2/pna/US110C_COMB.seq: * 

70: /ABSS/Data/CRF/ptodata/2/pna/US110D_COMB.seq: * 

71 : /ABSS/Data/CRF/ptodata/2/pna/USlllA_COMB. seq: * 

72 : /ABSS/Data/CRF/ptodata/2/pna/USlllB_C0MB. seq: * 

73 : /ABSS/Data/CRF/ptodata/2/pna/US112_COMB. seq: * 

74: /ABSS/Data/CRF/ptodata/2/pna/US113A_COMB.seq: * 

75: /ABSS/Data/CRF/ptodata/2/pna/US113B_COMB.seq: * 

76 : /ABSS/Data/CRF/ptodata/2/pna/US113C_COMB.seq: * 
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11: /ABSS/Data/CRF/ptociata/2/pna/US113D_COMB. seq: * 

78 : /ABSS/Data/CRF/ptodata/2/pna/US114A_COMB. seq: * 

79 : /ABSS/Data/CRF/ptodata/2/pna/US114B_COMB. seq: * 

80 : /ABSS/Data/CRF/ptoclata/2/pna/US114C_C0MB. seq: * 

81 : /ABSS/Data/CRF/ptodata/2/pna/US115A_COMB.seq: * 

82: /ABSS/Data/CRF/ptodata/2/pna/US115B_COMB.seq: * 

83 : /ABSS/Data/CRF/ptodata/2/pna/US116_COMB. seq: * 

84 : /ABSS/Data/CRF/ptodata/2/pna/US117_COMB. seq: * 

85 : /ABSS/Data/CRF/ptodata/2/pna/US118_C0MB. seq: * 

86 : /ABSS/Data/CRF/ptodata/2/pna/US119_COMB.seq: * 

87: /ABSS/Data/CRF/ptodata/2/pna/US120_COMB.seq: * 

88 : /ABSS/Data/CRF/ptodata/2/pna/US121_COMB. seq: * 

89 : /ABSS/Data/CRF/ptodata/2/pna/US122_COMB.seq: * 

90: /ABSS/Data/CRF/ptodata/2/pna/US123_COMB.seq: * 

91 : /ABSS/Data/CRF/ptodata/2/pna/US124_COMB.seq: * 

92: /ABSS/Data/CRF/ptodata/2/pna/US125_COMB.seq: * 

93 : /ABSS/Data/CRF/ptodata/2/pna/US127_COMB. seq: * 

94: /ABSS/Data/CRF/ptodata/2/pna/US600_COMB.seq: * 

95: /ABSS/Data/CRF/ptodata/2/pna/US601_COMB.seq: * 

96 : /ABSS/Data/CRF/ptodata/2/pna/US602A_COMB. seq: * 

97 : /ABSS/Data/CRF/ptodata/2/pna/US602B_COMB. seq: * 

98 : /ABSS/Data/CRF/ptodata/2/pna/US603_COMB. seq: * 

99: /ABSS/Data/CRF/ptodata/2/pna/US604A_COMB.seq: * 
100: /ABSS/Data/CRF/ptodata/2/pna/US604B_COMB. seq: * 
101 : /ABSS/Data/CRF/ptodata/2/pna/US505_COMB. seq: * 
102 : /ABSS/Data/CRF/ptodata/2/pna/US606_COMB.seq: * 
103 : /ABSS/Data/CRF/ptodata/2/pna/US607_COMB.seq: * 
104: /ABSS/Data/CRF/ptodata/2/pna/US608_COMB.seq: * 
105: /ABSS/Data/CRF/ptodata/2/pna/US609_COMB.seq: * 
106 : /ABSS/Data/CRF/ptodata/2/pna/US610_COMB. seq: * 
107 : /ABSS/Data/CRF/ptodata/2/pna/US611_COMB.seq: * 
108: /ABSS/Data/CRF/ptodata/2/pna/US612_COMB.seq: * 

SUMMARIES 

% 

Result Query 

No. Score Match Length DB ID Description 



1 


6070 


100 


0 


6070 


46 


US- 


10-506-327 


-23 


Sequence 23, Appl 


2 


1396 


23 


0 


1396 


46 


us- 


10-506-327 


-22 


Sequence 22, Appl 


3 


977 . 8 


16 


1 


1051 


4 


PCT- 


US09-32660 


-5 


Sequence 5, Appli 


4 


977 .8 


16 


1 


1051 


90 


us- 


12-363-326 


-5 


Sequence 5, Appli 


5 


977.8 


16 


1 


3029 


4 


PCT- 


US09-32660 


-30 


Sequence 30, Appl 


6 


977 . 8 


16 


1 


3029 


90 


us- 


12-363-326 


-30 


Sequence 30, Appl 


7 


977 . 8 


16 


1 


3749 


4 


PCT- 


US09-32660 


-31 


Sequence 31, Appl 


8 


977 . 8 


16 


1 


3749 


90 


US- 


12-363-326 


-31 


Sequence 31, Appl 


9 


977 . 8 


16 


1 


3971 


4 


PCT- 


US09-32660 


-32 


Sequence 32, Appl 


10 


977.8 


16 


1 


3971 


90 


US- 


12-363-326 


-32 


Sequence 32, Appl 


11 


977 . 8 


16 


1 


4691 


4 


PCT- 


US09-32660 


-33 


Sequence 33, Appl 


12 


977 . 8 


16 


1 


4691 


90 


US- 


12-363-326 


-33 


Sequence 33, Appl 


13 


977.8 


16 


1 


4913 


4 


PCT- 


US09-32660 


-34 


Sequence 34, Appl 


14 


977.8 


16 


1 


4913 


90 


US- 


12-363-326 


-34 


Sequence 34, Appl 


15 


977.8 


16 


1 


5633 


4 


PCT- 


US09-32660 


-35 


Sequence 35, Appl 


16 


977 . 8 


16 


1 


5633 


90 


US- 


12-363-326 


-35 


Sequence 35, Appl 


17 


956 


15 


7 


1080 


4 


PCT- 


US09-32660 


-26 


Sequence 26, Appl 


18 


956 


15 


7 


1080 


90 


US- 


12-363-326 


-26 


Sequence 26, Appl 


19 


321 


5 


3 


1151 


46 


US- 


10-506-327 


-16 


Sequence 16, Appl 


20 


320 . 4 


5 


3 


1172 


46 


US- 


10-506-327 


-2 


Sequence 2, Appli 


21 


320 . 4 


5 


3 


1175 


46 


us- 


10-506-327 


-20 


Sequence 20, Appl 


22 


84.8 


1 


4 


1892 


87 


us- 


12-090-702 


-19 


Sequence 19, Appl 


23 


80. 4 


1 


3 


1149 


41 


us- 


10-266-090 


-33588 


Sequence 33588, A 


24 


80. 4 


1 


3 


1319 


41 


us- 


10-266-090 


-24327 


Sequence 24327, A 
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c 25 
c 26 
27 
c 28 
c 29 
c 30 



79. 4 

79 . 4 
79 . 2 



77.8 

77 . 6 
77 . 6 
77 . 6 
77 . 2 



79 
78 



1.3 1317241 

1.3 1317241 

1.3 8056 

1.3 1063 

1.3 1003 

1.3 8056 

1.3 1554 

1.3 1554 

1.3 8056 

1.3 2205 

1.3 824 

1.3 2300 

1.3 2300 

1.3 2300 

1.3 2300 

1.3 6000 

1.3 6000 

1.3 627 

1.3 3673778 

1.2 4247 

1.2 4247 



3 

72 
45 
41 
41 
45 
46 
46 
45 
41 
96 
3 
83 
83 
103 
104 
104 
45 

43 
90 
107 



PCT-US06-08981-73 
US-11-184-236-73 
US-10-473-126-240 
US-10-266-090-10455 
US-10-266-090-37449 
US-10-473-126-386 
US-10-595-495-123 
US-10-595-495A-123 
US-10-473-126-386 
US-10-266-090-32333 
US-60-207-458-18907 



Sequence 73, Appl 

Sequence 73, Appl 
Sequence 240, App 
Sequence 10455, A 
Sequence 37449, A 
Sequence 386, App 
Sequence 123, App 
Sequence 123, App 
Sequence 38 6, App 
Sequence 32333, A 
Sequence 18907, A 



31 
32 
33 



c 34 



35 
36 
37 
38 
39 
40 
41 



76 . 8 
76.8 
76.8 
76.8 
76.8 
76 . 8 
76.2 
76.2 
75.8 
75.8 



77 



PCT-US06- 46920-35494 



US-11-636-385-35494 

US-11-636-385A-35 494 
US-60-762-056-35494 
US-60-873-739-6389 
US-60-873-853-1518 

US-10-425-1 15-2496 4 
US-10-312-841A-1 

US-12-332-703-59 
US-61-121-882-59 



Sequence 35494, A 
Sequence 35494, A 
Sequence 35494, A 
Sequence 35494, A 
Sequence 6389, Ap 
Sequence 1518, Ap 
Sequence 24964, A 

Sequence 1, Appli 
Sequence 59, Appl 
Sequence 59, Appl 



c 42 

c 43 

c 44 

C 45 



ALIGNMENTS 



RESULT 1 

US-10-506-327-23 

; Sequence 23, Application US/10506327 

; GENERAL INFORMATION: 

; APPLICANT: HIRAMATSU, Shingo 

; APPLICANT: TANAKA, Takashi 

; APPLICANT: YAMADA, Katsushige 

; APPLICANT: TAMURA, Toshiki 

; TITLE OF INVENTION: PRODUCTION OF PHYSIOLOGICALLY ACTIVE PROTEINS USING GENE RECOMB 

; TITLE OF INVENTION: SILKWORMS 

; FILE REFERENCE: 0210-0190PUS1 

; CURRENT APPLICATION NUMBER: US/ 1 0/506 , 32 7 

; CURRENT FILING DATE: 2004-09-02 

; PRIOR APPLICATION NUMBER: PCT/JP03/02675 

; PRIOR FILING DATE: 2003-03-06 

; NUMBER OF SEQ ID NOS : 38 

; SOFTWARE: Patent-In 3.2 

; SEQ ID NO 23 

; LENGTH: 6 070 

; TYPE: DNA 

; ORGANISM: Bombyx mori 

US-10-506-327-23 

Query Match 100.0%; Score 6070; DB 46; Length 6070; 

Best Local Similarity 100.0%; 

Matches 6070; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 TCAAGACATCCTTGATTAAGGCAGCTGCCGATATTGACATGGACCTCGTTCGTGCTGCGA 5 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TCAAGACATCCTTGATTAAGGCAGCTGCCGATATTGACATGGACCTCGTTCGTGCTGCGA 60 

Qy 61 TAGACGACTGGCCGCGCAGATTGAAGGCCTGTATTCAAAATCACGGAGGTCATTTTGAAT 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TAGACGACTGGCCGCGCAGATTGAAGGCCTGTATTCAAAATCACGGAGGTCATTTTGAAT 120 
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Qy 121 AAACTTTAGTGTCATAAGAATCTATGTTTTGTTAAGTTCATTTTGGTATATGAATGGTTA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AAACTTTAGTGTCATAAGAATCTATGTTTTGTTAAGTTCATTTTGGTATATGAATGGTTA 180 

Qy 181 CATAATGAATAAACTTGTTTCAATTATTTTACATTAAACATGTGACAGAATTTATGACCT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CATAATGAATAAACTTGTTTCAATTATTTTACATTAAACATGTGACAGAATTTATGACCT 240 

Qy 241 GACTAGGTAGGTACAAACAGCCTTTTTGATATTAGAAAACTAAGTAAAATAGCCTACGGT 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GACTAGGTAGGTACAAACAGCCTTTTTGATATTAGAAAACTAAGTAAAATAGCCTACGGT 300 

Qy 301 CACATCTCTTTCCGTGGGTGTCGTTAAAGGGCGACTTAGAGAACCACCAAGAACGTAGCA 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CACATCTCTTTCCGTGGGTGTCGTTAAAGGGCGACTTAGAGAACCACCAAGAACGTAGCA 360 

Qy 361 GAATCCTCAGAGTGTCATACCAGCATACAGCCATCGCTAACTGCTATTTACTGGTAATAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GAATCCTCAGAGTGTCATACCAGCATACAGCCATCGCTAACTGCTATTTACTGGTAATAG 420 

Qy 421 GGCACATTGTAATCTCACTTAACCATACTGTCGGGCCACCATCTAGCCTATTTCTGCCAC 480 

I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GGCACATTGTAATCTCACTTAACCATACTGTCGGGCCACCATCTAGCCTATTTCTGCCAC 480 

Qy 481 GAATCAATCGTGAGTGATGGACATAGAGAAACTATTAGTTGAGAAGAAAACAAGAGCACT 540 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GAATCAATCGTGAGTGATGGACATAGAGAAACTATTAGTTGAGAAGAAAACAAGAGCACT 540 

Qy 541 AAAGGTTTGATATTGACAAAAATCTACTTCGCCGTCACTCCATAGGTTTATTGTCTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AAAGGTTTGATATTGACAAAAATCTACTTCGCCGTCACTCCATAGGTTTATTGTCTCTCA 600 

Qy 601 TTAGTCCAGAACAGCAGTTACAGACGTAAGCTTTTACGCACAAACTACAGGGTTGCTCTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TTAGTCCAGAACAGCAGTTACAGACGTAAGCTTTTACGCACAAACTACAGGGTTGCTCTT 660 

Qy 661 TATTGTATCGAAAATATGGGACCTGAATAAGGGCGATTTTGACGCGTCCTGCCCGCCCAT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 TATTGTATCGAAAATATGGGACCTGAATAAGGGCGATTTTGACGCGTCCTGCCCGCCCAT 720 

Qy 721 TCCCGATCCTACGGACAGAATGGCAAGCAGTCGACGTCGCCCCAAACACGTCATTTCGGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TCCCGATCCTACGGACAGAATGGCAAGCAGTCGACGTCGCCCCAAACACGTCATTTCGGA 780 

Qy 781 TCCTCACGATCCACTAACGGTGCTTTAGGTACCTCAAGCACCGGTCATCGTTCTCGTCGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 TCCTCACGATCCACTAACGGTGCTTTAGGTACCTCAAGCACCGGTCATCGTTCTCGTCGG 840 

Qy 841 ACCCGTCGCTTGCGACGAAGGGCTCGACGAGCAAATTAACCCTCAGACACAGCCCACTGA 90 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 ACCCGTCGCTTGCGACGAAGGGCTCGACGAGCAAATTAACCCTCAGACACAGCCCACTGA 900 

Qy 901 GTTTCTCGCCGGATCTTCTCAGCGGGTCGCGTTTCCGATCCGGTGGTAGATTCTGCGAAG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 GTTTCTCGCCGGATCTTCTCAGCGGGTCGCGTTTCCGATCCGGTGGTAGATTCTGCGAAG 960 

Qy 961 CACGGCTCTTGCTAGGATTCGTGTTAGCAACGTCGTCAGGTTTGAGCCCCGTGAGCTCAC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 CACGGCTCTTGCTAGGATTCGTGTTAGCAACGTCGTCAGGTTTGAGCCCCGTGAGCTCAC 1020 

Qy 1021 TTACTAGTTAAGGTTACGCTGAAATAGCCTCTCAAGGCTCTCAGCTAGGTAGGAAACAAA 1080 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TTACTAGTTAAGGTTACGCTGAAATAGCCTCTCAAGGCTCTCAGCTAGGTAGGAAACAAA 1080 

Qy 1081 AAAAAAAGTCCTGCCCTTAACACCGTTGCGATGGCTTGTCTTCTGCAGCGTACTGTCGTG 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AAAAAAAGTCCTGCCCTTAACACCGTTGCGATGGCTTGTCTTCTGCAGCGTACTGTCGTG 1140 

Qy 1141 GCAGGGCGGTACCGCACCATCTTTTTCGACGCCACCTTGTGATCTGAAGGCGAAGATACT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GCAGGGCGGTACCGCACCATCTTTTTCGACGCCACCTTGTGATCTGAAGGCGAAGATACT 1200 

Qy 1201 CGACCTTAATGATTGAGGCAAGAGCGTAATACCTCGCGCTCCCTAGACGAGTAGATCTCG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CGACCTTAATGATTGAGGCAAGAGCGTAATACCTCGCGCTCCCTAGACGAGTAGATCTCG 1260 

Qy 1261 TGGAAGATTCGGCACACGGCACACAAAAATAGCTTTTGAGATAGCCTTCAATGTAATTAT 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1251 TGGAAGATTCGGCACACGGCACACAAAAATAGCTTTTGAGATAGCCTTCAATGTAATTAT 1320 

Qy 1321 GTTTTTATATATATTTACTAGCTGACCCGGCAAACGTTGTGTTGCCTTAAATAAGATTTC 1380 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GTTTTTATATATATTTACTAGCTGACCCGGCAAACGTTGTGTTGCCTTAAATAAGATTTC 1380 

Qy 1381 TAGGGAAATTCTAGTGTAGAAAAATAACCTCATTCAACCACATAATACCTCATTATAACC 1440 

I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 TAGGGAAATTCTAGTGTAGAAAAATAACCTCATTCAACCACATAATACCTCATTATAACC 1440 

Qy 1441 AAAAAAAAATAATATCCAAAAAATAAAAATATAAAATAAATGTTTGGGGTGGACAACCCT 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 AAAAAAAAATAATATCCAAAAAATAAAAATATAAAATAAATGTTTGGGGTGGACAACCCT 1500 

Qy 1501 TATCACATAGGGGTATGAAAATTAGATAGTAGCCGATTCTCAGACCTACTGAACATACTA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 TATCACATAGGGGTATGAAAATTAGATAGTAGCCGATTCTCAGACCTACTGAACATACTA 1560 

Qy 1561 TTGATACACAAATAAAACCAAAAAAACATGGCTGAAAAATGTATAGTAGGTATTGTATTA 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 TTGATACACAAATAAAACCAAAAAAACATGGCTGAAAAATGTATAGTAGGTATTGTATTA 1620 

Qy 1621 TTAAGTGTATAATCTATGATGTATATGAGTAAGTAAGACAGGAGACCGGCTTCGTCCTCA 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 TTAAGTGTATAATCTATGATGTATATGAGTAAGTAAGACAGGAGACCGGCTTCGTCCTCA 1680 

Qy 1681 TCCGTCATAAAAACCGTCATAAAAATCAAACCCGCAAAATTATAATTTGCGTAATTACTG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TCCGTCATAAAAACCGTCATAAAAATCAAACCCGCAAAATTATAATTTGCGTAATTACTG 1740 

Qy 1741 GTGGCTGGTGGTAGGACCTTCTTGTGAGTCCGCGCGGGTAGGTACCACCATCTGACTATT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GTGGCTGGTGGTAGGACCTTCTTGTGAGTCCGCGCGGGTAGGTACCACCATCTGACTATT 1800 

Qy 1801 CTGCCGTGAAGCAGTAATGGGTTTCGGTTTGAAGGGCGGGACAGCCGTTGTAACTATACT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 CTGCCGTGAAGCAGTAATGGGTTTCGGTTTGAAGGGCGGGACAGCCGTTGTAACTATACT 1860 

Qy 1861 TGAGACCTTAGAACTTATATCTCAATGTGGGTGGCGCATTTTTTTACGGTAGGCAGCGGC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TGAGACCTTAGAACTTATATCTCAATGTGGGTGGCGCATTTTTTTACGGTAGGCAGCGGC 1920 

Qy 1921 TTGGCTCTGCCCCTGGCATTGCTGAAGTCCATAGGCGACGGTTACCACTCACCATCAGGT 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1921 TTGGCTCTGCCCCTGGCATTGCTGAAGTCCATAGGCGACGGTTACCACTCACCATCAGGT 1980 

Qy 1981 GGGCCGTATGGCCGTCTGCCTACAAAATCAATAAAAAAAAAATAAAAAATTTACGTTGTA 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GGGCCGTATGGCCGTCTGCCTACAAAATCAATAAAAAAAAAATAAAAAATTTACGTTGTA 2040 

Qy 2041 GATGTCTATGGGCTCCAGTAACCACTTAACACCAGGCGGGCTGTGAGCTCGTCCACCCAT 2100 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GATGTCTATGGGCTCCAGTAACCACTTAACACCAGGCGGGCTGTGAGCTCGTCCACCCAT 2100 

Qy 2101 CTAAGCAATAAAAATAAATAAATAGATAGTTGATCAGTAGTGGACCGGCGAGGGCGGGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CTAAGCAATAAAAATAAATAAATAGATAGTTGATCAGTAGTGGACCGGCGAGGGCGGGAG 2160 

Qy 2161 ATCAAATTGAATTTAAAATAAAACATAATTAAAGGAATTTGAAACTATAAACTCTGAATA 2220 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 ATCAAATTGAATTTAAAATAAAACATAATTAAAGGAATTTGAAACTATAAACTCTGAATA 2220 

Qy 2221 ATAATTTATCGTACTACAATTATAATATTTGATTGCCATCTTGCAACCTTATTGCGGATC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 ATAATTTATCGTACTACAATTATAATATTTGATTGCCATCTTGCAACCTTATTGCGGATC 2280 

Qy 2281 TGTGAATAGAAAAAAAAAAAAAATCGGGATGGAAAAATAGGGGTTGATCGTATAAGAGTG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 TGTGAATAGAAAAAAAAAAAAAATCGGGATGGAAAAATAGGGGTTGATCGTATAAGAGTG 2340 

Qy 2341 AAAATTGAGAGTAATATGGAATTTTTTTATTTTAAGTCATGACAAAATAAAAATAAGATC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AAAATTGAGAGTAATATGGAATTTTTTTATTTTAAGTCATGACAAAATAAAAATAAGATC 2400 

Qy 2401 TTGCCAAAAAAATTTAAGTTTATTATTAAATTAAGTTTAACAAATAAAAAATTGGGGTTG 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 TTGCCAAAAAAATTTAAGTTTATTATTAAATTAAGTTTAACAAATAAAAAATTGGGGTTG 2460 

Qy 2461 ATCGCAGAGGGGTGAAAATTTAGGGTTTTATGTATTTTTGTATGCTGTATCATAAAAAAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 ATCGCAGAGGGGTGAAAATTTAGGGTTTTATGTATTTTTGTATGCTGTATCATAAAAAAA 2520 

Qy 2521 TAAAAACAAAAAATAAAAATAGGGGGATGAAAAATAAATGTTGTTCGATTCTCAACCCTG 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 TAAAAACAAAAAATAAAAATAGGGGGATGAAAAATAAATGTTGTTCGATTCTCAACCCTG 2580 

Qy 2581 GCCGATATGCACGCTAAGATTCACAAAAATCGGTCGAGCCGTTTCGGAGGAGTTCAATCA 26 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 GCCGATATGCACGCTAAGATTCACAAAAATCGGTCGAGCCGTTTCGGAGGAGTTCAATCA 26 40 

Qy 2641 CGCACCCCGTCACACGAGAATTTTATTTATTAGATTTAGAAGAGCTGAAAGATAAATCGA 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 CGCACCCCGTCACACGAGAATTTTATTTATTAGATTTAGAAGAGCTGAAAGATAAATCGA 2700 

Qy 2701 TATTTAATTTTGTAAGTTGTCTTGATGATACATTTTTTCGTTTGTCATTCTTTCCTGCAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 TATTTAATTTTGTAAGTTGTCTTGATGATACATTTTTTCGTTTGTCATTCTTTCCTGCAG 2760 

Qy 2761 TTAGAACATAATATAAAATGCAAATGAAAAATAGAAATATAATAAATAATAATAAATAAA 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 761 TTAGAACATAATATAAAATGCAAATGAAAAATAGAAATATAATAAATAATAATAAATAAA 28 20 

Qy 2821 TAATAAATATTTACTAACAATCACGCTACGTTAACTGGTCCCGTGATAAGTTCGTAAAGA 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 TAATAAATATTTACTAACAATCACGCTACGTTAACTGGTCCCGTGATAAGTTCGTAAAGA 2880 
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Qy 2881 ACTTGTGTTACAGGTACCAGATAACGGATATAAATGTAAGATTTTTATTATACACATACA 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 ACTTGTGTTACAGGTACCAGATAACGGATATAAATGTAAGATTTTTATTATACACATACA 2940 

Qy 2941 TATATTTCATATACATTCATAACCCTGGAAAATACATTTATATTTATCATACAAATATCT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 TATATTTCATATACATTCATAACCCTGGAAAATACATTTATATTTATCATACAAATATCT 3000 

Qy 3001 TCCCTTGGCGGGATTCGAACCCGCGACCCCCTTGTGTAGTGACAATGTCACTTACCACTA 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 TCCCTTGGCGGGATTCGAACCCGCGACCCCCTTGTGTAGTGACAATGTCACTTACCACTA 3060 

Qy 3061 CACCCTCTGGCATTGCTGGGCGACGGTAACCACCCACCATTAGGTGGGCCATATGCTCGT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 CACCCTCTGGCATTGCTGGGCGACGGTAACCACCCACCATTAGGTGGGCCATATGCTCGT 3120 

Qy 3121 CTGCCTACAAGGGAAATAAAAAAAATATCCTAATATAAATTGCATTAATTTTTTTAAACC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 CTGCCTACAAGGGAAATAAAAAAAATATCCTAATATAAATTGCATTAATTTTTTTAAACC 3180 

Qy 3181 GACTTTCAATCACAATGAAGACAGATTCTCGTCGAAGTTTGTTTTTGAAACTATATCAAT 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GACTTTCAATCACAATGAAGACAGATTCTCGTCGAAGTTTGTTTTTGAAACTATATCAAT 3240 

Qy 3241 AACTTTTCATTATCCGTTCTTCGTCTTTTGTCTTTTTTTCGCAAACAAAACGAACAAAAC 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 AACTTTTCATTATCCGTTCTTCGTCTTTTGTCTTTTTTTCGCAAACAAAACGAACAAAAC 3300 

Qy 3301 GTTCTAATTCGAAAGATGTTTTGTACGGAAAGTTTGAATAAGTGCTTAATTGCAAGTAAC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 GTTCTAATTCGAAAGATGTTTTGTACGGAAAGTTTGAATAAGTGCTTAATTGCAAGTAAC 3360 

Qy 3361 GTAACAATGTTTTAGGGTTCGGTCCTCAATAAATTCGACCAATAAACCATACAAATTCTT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTAACAATGTTTTAGGGTTCGGTCCTCAATAAATTCGACCAATAAACCATACAAATTCTT 3420 

Qy 3421 TAACATTTTTTTAATCTTATACTAGCTGACCCGGCAGACTTCGTGGTGCCTCAATCGATA 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 TAACATTTTTTTAATCTTATACTAGCTGACCCGGCAGACTTCGTGGTGCCTCAATCGATA 3480 

Qy 3481 AATAAAATACCTATGCTTCTGTATAAAATAAACATAAAACAAACAAAAGGAATCCGTCCG 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 AATAAAATACCTATGCTTCTGTATAAAATAAACATAAAACAAACAAAAGGAATCCGTCCG 3540 

Qy 3541 ACGGGAGACACATCAAAGGAAAAACATCTTTTTTATTTTTTTACCTTTTAAACCTTCTCT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 ACGGGAGACACATCAAAGGAAAAACATCTTTTTTATTTTTTTACCTTTTAAACCTTCTCT 3600 

Qy 3601 GGACTTCCACAAATAATTTAAGACCAAAATTAGCCAAATCGGTCTAGCATTTTCGAGTTT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 GGACTTCCACAAATAATTTAAGACCAAAATTAGCCAAATCGGTCTAGCATTTTCGAGTTT 3660 

Qy 3651 TAGCGAGACTAACGAACAGCAATTCATTTTTATATACACAGATTTATGTTACCGGGGTCT 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 TAGCGAGACTAACGAACAGCAATTCATTTTTATATACACAGATTTATGTTACCGGGGTCT 3720 

Qy 3721 AGTGACCTAAACGACTTCAGCTCTAACACTAGGCTAACTCAGGCTTAGTAGCCTGGTCCT 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 AGTGACCTAAACGACTTCAGCTCTAACACTAGGCTAACTCAGGCTTAGTAGCCTGGTCCT 3780 
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Qy 3781 AGTGTTAGATTTGAAGTCGTCTAATGCAAAGATTATTGGATCTGATGGATCCGTAAGGAC 3840 

I I I I I I I I I I I I I I I I I I I I I I I I M I 11 I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AGTGTTAGATTTGAAGTCGTCTAATGCAAAGATTATTGGATCTGATGGATCCGTAAGGAC 3840 

Qy 3841 GTGTCTAGAGCGTCGACGGTGACTAGCTCCTGCGTGATCAGGAAAAATGTGGAAAGCTTA 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 GTGTCTAGAGCGTCGACGGTGACTAGCTCCTGCGTGATCAGGAAAAATGTGGAAAGCTTA 3900 

Qy 3901 ACGATTTTGTCACATTTTACTTATCACAACTTGTTTTTATAATAATTCGCTTAAATGAGC 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 ACGATTTTGTCACATTTTACTTATCACAACTTGTTTTTATAATAATTCGCTTAAATGAGC 3960 

Qy 3961 AGCTATTACTTAATCTCGTAGTGGTTTTTGACAAAATCAGCTTCTTTAGAACTAAAATAT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 AGCTATTACTTAATCTCGTAGTGGTTTTTGACAAAATCAGCTTCTTTAGAACTAAAATAT 4020 

Qy 4021 CATTTTTTTCGTAATTTTTTTAATGAAAAATGCTCTAGTGTTATACCTTTCCAAAATCAC 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 CATTTTTTTCGTAATTTTTTTAATGAAAAATGCTCTAGTGTTATACCTTTCCAAAATCAC 4080 

Qy 4081 CATTAATTAGGTAGTGTTTAAGCTTGTTGTACAAAACTGCCACACGCATTTTTTTCTCCA 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 CATTAATTAGGTAGTGTTTAAGCTTGTTGTACAAAACTGCCACACGCATTTTTTTCTCCA 4140 

Qy 4141 CTGTAGGTTGTAGTTACGCGAAAACAAAATCGTTCTGTGAAAATTCAAACAAAAATATTT 4200 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 CTGTAGGTTGTAGTTACGCGAAAACAAAATCGTTCTGTGAAAATTCAAACAAAAATATTT 4200 

Qy 4201 TTTCGTAAAAACACTTATCAATGAGTAAAGTAACAATTCATGAATAATTTCATGTAAAAA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 TTTCGTAAAAACACTTATCAATGAGTAAAGTAACAATTCATGAATAATTTCATGTAAAAA 42 60 

Qy 4261 AAAAATACTAGAAAAGGAATTTTTCATTACGAGATGCTTAAAAATCTGTTTCAAGGTAGA 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 AAAAATACTAGAAAAGGAATTTTTCATTACGAGATGCTTAAAAATCTGTTTCAAGGTAGA 4320 

Qy 4321 GATTTTTCGATATTTCGGAAAATTTTGTAAAACTGTAAATCCGTAAAATTTTGCTAAACA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4321 GATTTTTCGATATTTCGGAAAATTTTGTAAAACTGTAAATCCGTAAAATTTTGCTAAACA 4380 

Qy 4381 TATATTGTGTTGTTTTGGTAAGTATTGACCCAAGCTATCACCTCCTGCAGTATGTCGTGC 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 TATATTGTGTTGTTTTGGTAAGTATTGACCCAAGCTATCACCTCCTGCAGTATGTCGTGC 4440 

Qy 4441 TAATTACTGGACACATTGTATAACAGTTCCACTGTATTGACAATAATAAAACCTCTTCAT 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 TAATTACTGGACACATTGTATAACAGTTCCACTGTATTGACAATAATAAAACCTCTTCAT 4500 

Qy 4501 TGACTTGAGAATGTCTGGACAGATTTGGCTTTGTATTTTTGATTTACAAATGTTTTTTTG 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 TGACTTGAGAATGTCTGGACAGATTTGGCTTTGTATTTTTGATTTACAAATGTTTTTTTG 4560 

Qy 4561 GTGATTTACCCATCCAAGGCATTCTCCAGGATGGTTGTGGCATCACGCCGATTGGCAAAC 4620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4561 GTGATTTACCCATCCAAGGCATTCTCCAGGATGGTTGTGGCATCACGCCGATTGGCAAAC 4620 

Qy 4621 AAAAACTAAAATGAAACTAAAAAGAAACAGTTTCCGCTGTCCCGTTCCTCTAGTGGGAGA 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4521 AAAAACTAAAATGAAACTAAAAAGAAACAGTTTCCGCTGTCCCGTTCCTCTAGTGGGAGA 4680 

Qy 4681 AAGCATGAAGTAAGTTCTTTAAATATTACAAAAAAATTGAACGATATTATAAAATTCTTT 4740 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4681 AAGCATGAAGTAAGTTCTTTAAATATTACAAAAAAATTGAACGATATTATAAAATTCTTT 4740 

Qy 4741 AAAATATTAAAAGTAAGAACAATAAGATCAATTAAATCATAATTAATCACATTGTTCATG 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 AAAATATTAAAAGTAAGAACAATAAGATCAATTAAATCATAATTAATCACATTGTTCATG 4800 

Qy 4801 ATCACAATTTAATTTACTTCATACGTTGTATTGTTATGTTAAATAAAAAGATTAATTTCT 48 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 ATCACAATTTAATTTACTTCATACGTTGTATTGTTATGTTAAATAAAAAGATTAATTTCT 4860 

Qy 4861 ATGTAATTGTATCTGTACAATACAATGTGTAGATGTTTATTCTATCGAAAGTAAATACGT 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 ATGTAATTGTATCTGTACAATACAATGTGTAGATGTTTATTCTATCGAAAGTAAATACGT 4920 

Qy 4921 CAAAACTCGAAAATTTTCAGTATAAAAAGGTTCAACTTTTTCAAATCAGCATCAGTTCGG 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4921 CAAAACTCGAAAATTTTCAGTATAAAAAGGTTCAACTTTTTCAAATCAGCATCAGTTCGG 4980 

Qy 4981 TTCCAACTCTCAAGATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGA 5040 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 TTCCAACTCTCAAGATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGA 5040 

Qy 5041 GTTAATTATTTTACTATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAA 5100 

I I I I I I I I I I I I I I I I I I I I I I M M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5041 GTTAATTATTTTACTATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAA 5100 

Qy 5101 TAAGTGGTCGCCAAAACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGG 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 TAAGTGGTCGCCAAAACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGG 5160 

Qy 5161 GGGGGCTACGGAATAAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACT 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 GGGGGCTACGGAATAAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACT 5220 

Qy 5221 TGTGATTTATTTGCGTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTT 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 TGTGATTTATTTGCGTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTT 5280 

Qy 5281 GCAATATCCTATTTCACCGGTAAATCAGCATTGCAATATGCAATGCATATTCAACAATAT 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5281 GCAATATCCTATTTCACCGGTAAATCAGCATTGCAATATGCAATGCATATTCAACAATAT 5340 

Qy 5341 GTAAAACAATTCGTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 GTAAAACAATTCGTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAA 5400 

Qy 5401 CCGCATTATTAATTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAAT 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 CCGCATTATTAATTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAAT 5460 

Qy 5461 TATAATCATTTTCATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTG 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 TATAATCATTTTCATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTG 55 20 

Qy 5521 ATTATAACACGAGCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACC 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5521 ATTATAACACGAGCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACC 5580 

Qy 5581 GATCACGTGATAGATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTT 56 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 5581 GATCACGTGATAGATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTT 56 40 

Qy 56 41 TCAGGTTGAGTCTGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCT 5 7 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5641 TCAGGTTGAGTCTGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCT 5700 

Qy 5701 AATAGGTAGGGAAAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCAT 5760 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5701 AATAGGTAGGGAAAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCAT 5760 

Qy 5761 AAAATCTCGTGGTGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAG 5820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5761 AAAATCTCGTGGTGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAG 5820 

Qy 5821 AATGTTGTTCAACTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTA 5880 

I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5821 AATGTTGTTCAACTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTA 5880 

Qy 5881 CTAAGGCAGTATGTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAA 5940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5881 CTAAGGCAGTATGTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAA 5940 

Qy 5941 TTTATAGCTCAATATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTT 6000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5941 TTTATAGCTCAATATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTT 6000 

Qy 6001 GTTTCAGTATGTCGCTTATACAAATGCAAACATCAATGATTTTGATGAGGACTATTTTGG 6060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6001 GTTTCAGTATGTCGCTTATACAAATGCAAACATCAATGATTTTGATGAGGACTATTTTGG 6060 

Qy 6051 GAGTGATGTC 6070 

I I I I I I I I I I 
Db 6061 GAGTGATGTC 6070 



RESULT 2 

US-10-506-327-22 

; Sequence 22, Application US/10506327 

; GENERAL INFORMATION: 

; APPLICANT: HIRAMATSU, Shingo 

; APPLICANT: TANAKA, Takashi 

; APPLICANT: YAMADA, Katsushige 

; APPLICANT: TAMURA, Toshiki 

; TITLE OF INVENTION: PRODUCTION OF PHYSIOLOGICALLY ACTIVE PROTEINS USING GENE RECOMB 

; TITLE OF INVENTION: SILKWORMS 

; FILE REFERENCE: 0210-0190PUS1 

; CURRENT APPLICATION NUMBER: US/ 10/506 , 32 7 

; CURRENT FILING DATE: 2004-09-02 

; PRIOR APPLICATION NUMBER: PCT/JP03/02675 

; PRIOR FILING DATE: 2003-03-06 

; NUMBER OF SEQ ID NOS : 38 

; SOFTWARE: Patent-In 3.2 

; SEQ ID NO 22 

; LENGTH: 1396 

; TYPE : DNA 

; ORGANISM: Bombyx mori 

US-10-506-327-22 



Query Match 23.0%; Score 1396; DB 46; Length 1396; 

Best Local Similarity 100.0%; 

Matches 1396; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
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Qy 4675 GGGAGAAAGCATGAAGTAAGTTCTTTAAATATTACAAAAAAATTGAACGATATTATAAAA 4734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GGGAGAAAGCATGAAGTAAGTTCTTTAAATATTACAAAAAAATTGAACGATATTATAAAA 60 

Qy 4735 TTCTTTAAAATATTAAAAGTAAGAACAATAAGATCAATTAAATCATAATTAATCACATTG 4794 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTCTTTAAAATATTAAAAGTAAGAACAATAAGATCAATTAAATCATAATTAATCACATTG 120 

Qy 4795 TTCATGATCACAATTTAATTTACTTCATACGTTGTATTGTTATGTTAAATAAAAAGATTA 4854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TTCATGATCACAATTTAATTTACTTCATACGTTGTATTGTTATGTTAAATAAAAAGATTA 180 

Qy 4855 ATTTCTATGTAATTGTATCTGTACAATACAATGTGTAGATGTTTATTCTATCGAAAGTAA 4914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 ATTTCTATGTAATTGTATCTGTACAATACAATGTGTAGATGTTTATTCTATCGAAAGTAA 2 40 

Qy 4915 ATACGTCAAAACTCGAAAATTTTCAGTATAAAAAGGTTCAACTTTTTCAAATCAGCATCA 4974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 ATACGTCAAAACTCGAAAATTTTCAGTATAAAAAGGTTCAACTTTTTCAAATCAGCATCA 300 

Qy 4975 GTTCGGTTCCAACTCTCAAGATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGC 5034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 GTTCGGTTCCAACTCTCAAGATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGC 360 

Qy 5035 AGGTGAGTTAATTATTTTACTATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACC 5094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGGTGAGTTAATTATTTTACTATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACC 420 

Qy 5095 TGATAATAAGTGGTCGCCAAAACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCAC 5154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 TGATAATAAGTGGTCGCCAAAACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCAC 480 

Qy 5155 GCCCGGGGGGGCTACGGAATAAACTACATTTATTTATTTAAAAAATGAACCTTAGATTAT 5214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GCCCGGGGGGGCTACGGAATAAACTACATTTATTTATTTAAAAAATGAACCTTAGATTAT 540 

Qy 5215 GTAACTTGTGATTTATTTGCGTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGC 5274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GTAACTTGTGATTTATTTGCGTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGC 600 

Qy 5275 AGACTTGCAATATCCTATTTCACCGGTAAATCAGCATTGCAATATGCAATGCATATTCAA 5334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AGACTTGCAATATCCTATTTCACCGGTAAATCAGCATTGCAATATGCAATGCATATTCAA 55 0 

Qy 5335 CAATATGTAAAACAATTCGTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAA 539 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAATATGTAAAACAATTCGTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAA 720 

Qy 5395 TTATAACCGCATTATTAATTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTC 5454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTATAACCGCATTATTAATTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTC 780 

Qy 5455 GCAAATTATAATCATTTTCATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGG 5514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GCAAATTATAATCATTTTCATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGG 840 

Qy 5515 TATGTGATTATAACACGAGCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGC 5574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 TATGTGATTATAACACGAGCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGC 900 
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Qy 5575 GTTACCGATCACGTGATAGATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAA 5634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 GTTACCGATCACGTGATAGATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAA 960 

Qy 5635 ATTCTTTCAGGTTGAGTCTGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTA 56 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 ATTCTTTCAGGTTGAGTCTGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTA 1020 

Qy 5695 CCAGCTAATAGGTAGGGAAAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGT 5754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CCAGCTAATAGGTAGGGAAAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGT 1080 

Qy 5755 GACCATAAAATCTCGTGGTGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACAT 5814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GACCATAAAATCTCGTGGTGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACAT 1140 

Qy 5815 AATTAGAATGTTGTTCAACTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTA 5874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 AATTAGAATGTTGTTCAACTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTA 1200 

Qy 5875 CCACTACTAAGGCAGTATGTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGT 5934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CCACTACTAAGGCAGTATGTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGT 1250 

Qy 5935 GCGAAATTTATAGCTCAATATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAA 5994 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GCGAAATTTATAGCTCAATATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAA 1320 

Qy 5995 CATTTTGTTTCAGTATGTCGCTTATACAAATGCAAACATCAATGATTTTGATGAGGACTA 6054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CATTTTGTTTCAGTATGTCGCTTATACAAATGCAAACATCAATGATTTTGATGAGGACTA 1380 

Qy 6055 TTTTGGGAGTGATGTC 6070 

I I I I I I I I I I I I I I I I 
Db 1381 TTTTGGGAGTGATGTC 1396 



RESULT 3 

PCT-US09-32660-5 

; Sequence 5, Application PC/TUS0932660 
; GENERAL INFORMATION 

; APPLICANT: ENTOGENETICS, INC. ET AL . 

; TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

; TITLE OF INVENTION : Spider Silk Polypeptides 

; FILE REFERENCE: 58835-370587 

; CURRENT APPLICATION NUMBER: PCT/US09/32660 

; CURRENT FILING DATE: 2009-01-30 

; PRIOR APPLICATION NUMBER: US 61/025,616 

; PRIOR FILING DATE: 2008-02-01 

; NUMBER OF SEQ ID NOS : 41 

; SOFTWARE: Patentin version 3.5 

; SEQ ID NO 5 

; LENGTH: 1051 

; TYPE : DNA 

; ORGANISM: Artificial Sequence 

; FEATURE : 

; OTHER INFORMATION: Chemically Synthesized 
PCT-US09-32660-5 

Query Match 16.1%; Score 977.8; DB 4; Length 1051; 

Best Local Similarity 98.9%; 
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Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAA.CCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 54 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I M M 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 
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Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 4 
US-12-363-326-5 

Sequence 5, Application US/12363326 
GENERAL INFORMATION 
APPLICANT: Brigham, David L. 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 
TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: US/ 12/363, 326 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: Patentin version 3.5 
SEQ ID NO 5 
LENGTH: 1051 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically Synthesized 
US-12-363-326-5 

Query Match 16.1%; Score 977.8; DB 90; Length 1051; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTT^GGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 5012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 5 

PCT-US09-32660-30 

; Sequence 30, Application PC/TUS0932660 

; GENERAL INFORMATION 

; APPLICANT: ENTOGENETICS, INC. ET AL . 

; TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

; TITLE OF INVENTION : Spider Silk Polypeptides 

; FILE REFERENCE: 58835-370587 

; CURRENT APPLICATION NUMBER: PCT/US09/32660 
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CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: PatentIn version 3.5 
SEQ ID NO 30 
LENGTH: 3029 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
PCT-US09-32660-30 

Query Match 16.1%; Score 977.8; DB 4; Length 3029; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I M 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 54 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 
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Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 6 

US-12-363-326-30 

Sequence 30, Application US/12363326 
GENERAL INFORMATION 
APPLICANT: Brigham, David L. 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 
TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: US / 1 2/363, 326 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: PatentIn version 3.5 
SEQ ID NO 30 
LENGTH: 3029 
TYPE : DNA 

ORGANISM: Artificial Sequence 

FEATURE : 

OTHER INFORMATION: Chemically synthesized 
US-12-363-326-30 

Query Match 16.1%; Score 977.8; DB 90; Length 3029; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 55 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 5012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 
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Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 7 

PCT-US09-32660-31 

Sequence 31, Application PC/TUS0932660 
GENERAL INFORMATION 
APPLICANT: ENTOGENETICS, INC. ET AL . 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 
TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: PCT/US09/32660 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: Patentin version 3.5 
SEQ ID NO 31 
LENGTH: 3749 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
PCT-US09-32660-31 

Query Match 16.1%; Score 977.8; DB 4; Length 3749; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I [ I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 350 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 957 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 8 

US-12-363-326-31 

; Sequence 31, Application US/12363326 

; GENERAL INFORMATION 

; APPLICANT: Brigham, David L. 

; TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

; TITLE OF INVENTION : Spider Silk Polypeptides 

; FILE REFERENCE: 58835-370587 

; CURRENT APPLICATION NUMBER: US/ 1 2/363, 326 

; CURRENT FILING DATE: 2009-01-30 

; PRIOR APPLICATION NUMBER: US 61/025,616 

; PRIOR FILING DATE: 2008-02-01 

; NUMBER OF SEQ ID NOS : 41 

; SOFTWARE: Patentin version 3.5 

; SEQ ID NO 31 

; LENGTH: 3749 

; TYPE : DNA 
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ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
US-12-363-326-31 

Query Match 16.1%; Score 977.8; DB 90; Length 3749; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 350 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 55 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 
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Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 957 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 9 

PCT-US09-32660-32 

Sequence 32, Application PC/TUS0932660 

GENERAL INFORMATION 
APPLICANT: ENTOGENETICS, INC. ET AL . 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 
TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: PCT/US09/32660 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: Patentin version 3.5 
SEQ ID NO 32 
LENGTH: 3971 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
PCT-US09-32660-32 

Query Match 16.1%; Score 977.8; DB 4; Length 3971; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 55 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 78 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 83 7 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 10 
US-12-363-326-32 
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Sequence 32, Application US/12363326 

GENERAL INFORMATION 
APPLICANT: Brigham, David L. 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 
TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: US/ 1 2/363, 326 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: PatentIn version 3.5 
SEQ ID NO 32 
LENGTH: 3971 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
US-12-363-326-32 

Query Match 16.1%; Score 977.8; DB 90; Length 3971; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 52 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 1 1 1 ! I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 78 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 83 7 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 11 

PCT-US09-32660-33 

; Sequence 33, Application PC/TUS0932660 

; GENERAL INFORMATION 

; APPLICANT: ENTOGENETICS, INC. ET AL . 

; TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

; TITLE OF INVENTION : Spider Silk Polypeptides 

; FILE REFERENCE: 58835-370587 

; CURRENT APPLICATION NUMBER: PCT/US09/32660 

; CURRENT FILING DATE: 2009-01-30 

; PRIOR APPLICATION NUMBER: US 61/025,616 

; PRIOR FILING DATE: 2008-02-01 

; NUMBER OF SEQ ID NOS : 41 

; SOFTWARE: Patentin version 3.5 

; SEQ ID NO 33 

; LENGTH: 4691 

; TYPE : DNA 

; ORGANISM: Artificial Sequence 
; FEATURE : 

; OTHER INFORMATION: Chemically synthesized 

PCT-US09-32660-33 



Query Match 16.1%; Score 977.8; DB 4; Lenqth 4691; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 
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Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 2 40 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 52 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTAT7VACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 
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Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 12 
US-12-363-326-33 

Sequence 33, Application US/12363326 
GENERAL INFORMATION 
APPLICANT: Brigham, David L. 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: US/ 12/363, 326 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: Patentin version 3.5 
SEQ ID NO 33 
LENGTH: 4691 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
US-12-363-326-33 

Query Match 16.1%; Score 977.8; DB 90; Length 4691; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 5652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5553 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5 712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 13 

PCT-US09-32660-34 

; Sequence 34, Application PC/TUS0932660 
; GENERAL INFORMATION 

; APPLICANT: ENTOGENETICS, INC. ET AL . 

; TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

; TITLE OF INVENTION : Spider Silk Polypeptides 

; FILE REFERENCE: 58835-370587 

; CURRENT APPLICATION NUMBER: PCT/US09/32660 

; CURRENT FILING DATE: 2009-01-30 
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PRIOR APPLICATION NUMBER: US 61/025,616 

PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS: 41 
SOFTWARE: PatentIn version 3.5 
SEQ ID NO 34 
LENGTH: 4913 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
PCT-US09-32660-34 

Query Match 16.1%; Score 977.8; DB 4; Length 4913; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 51 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 56 52 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 78 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 83 7 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 14 

US-12-363-326-34 

; Sequence 34, Application US/12363326 

; GENERAL INFORMATION 

; APPLICANT: Brigham, David L. 

; TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 

; TITLE OF INVENTION : Spider Silk Polypeptides 

; FILE REFERENCE: 58835-370587 

; CURRENT APPLICATION NUMBER: US/ 12/363, 326 

; CURRENT FILING DATE: 2009-01-30 

; PRIOR APPLICATION NUMBER: US 61/025,616 

; PRIOR FILING DATE: 2008-02-01 

; NUMBER OF SEQ ID NOS : 41 

; SOFTWARE: Patentin version 3.5 

; SEQ ID NO 34 

; LENGTH: 4913 

; TYPE : DNA 

; ORGANISM: Artificial Sequence 
; FEATURE : 

; OTHER INFORMATION: Chemically synthesized 

US-12-363-326-34 



Query Match 16.1%; Score 977.8; DB 90; Length 4913; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 6 0 



Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 
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Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 56 52 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5653 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 7 77 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 
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Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 



RESULT 15 
PCT-US09-32660-35 

Sequence 35, Application PC/TUS0932660 
GENERAL INFORMATION 
APPLICANT: ENTOGENETICS, INC. ET AL . 

TITLE OF INVENTION: Methods, Compositions and Systems for Production of Recombinant 
TITLE OF INVENTION: Spider Silk Polypeptides 
FILE REFERENCE: 58835-370587 
CURRENT APPLICATION NUMBER: PCT/US09/32660 
CURRENT FILING DATE: 2009-01-30 
PRIOR APPLICATION NUMBER: US 61/025,616 
PRIOR FILING DATE: 2008-02-01 
NUMBER OF SEQ ID NOS : 41 
SOFTWARE: Patentin version 3.5 
SEQ ID NO 35 
LENGTH: 5633 
TYPE : DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Chemically synthesized 
PCT-US09-32660-35 

Query Match 16.1%; Score 977.8; DB 4; Length 5633; 

Best Local Similarity 98.9%; 

Matches 1037; Conservative 0; Mismatches 7; Indels 5; Gaps 5; 

Qy 4995 ATGAGAGTCAAAACCTTTGTGATCTTGTGCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGAGAGTCAAAACCTTTGTGATCTTGGTCTGCGCTCTGCAGGTGAGTTAATTATTTTAC 60 

Qy 5055 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TATTATTTCAGAAGGTGGCCAGACGATATCACGGGCCACCTGATAATAAGTGGTCGCCAA 120 

Qy 5115 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCGGGGGGGCTACGGAAT 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AACGCACAGATATCGTAAATTGTGCCATTTGATTTGTCACGCCCTGGGGGGCTACGGAAT 180 

Qy 5175 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 5234 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AAACTACATTTATTTATTTAAAAAATGAACCTTAGATTATGTAACTTGTGATTTATTTGC 240 

Qy 5235 GTCAAAAGTAGGCAAGATGAATCTATGTAAATACCTGGGCAGACTTGCAATATCCTATTT 5294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GTCAAAAGTAGGCAAGATGAATCTATGTAAATA-CTGGGCAGACTTGCAATATCCTATTT 299 

Qy 5295 CACCGGT-AAATCAGCATTGCAATATGCAATGC-ATATTCAACAATATGTAAAACAATTC 5352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CACCGGTAAAATCAGCATTGCAATATGCAATGCTAAATTCAACAATATGTAAAACAATTC 359 

Qy 5353 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 5412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GTAAAGCATCATTAGAAAATAGACGAAAGAAATTGCATAAAATTATAACCGCATTATTAA 419 

Qy 5413 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAATTATAATCATTTT 5472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 420 TTTATTATGATATCTATTAACAATTGCTATTGCCTTTTTTTCGCAAA.TTATAATCATTTT 479 

Qy 5473 CATAACCTCGAGGTAGCATTCTGTTACATTTTAATACATTGGTATGTGATTATAACACGA 5532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CATAACCTCGAGGTAGCATTCTG-TACATTTTAATACATTGGTATGTGATTATAACACGA 538 

Qy 5533 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 5592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 GCTGCCCACTGAGTTTCTCGCCAGATCTTCTCAGTGGGTCGCGTTACCGATCACGTGATA 598 

Qy 5593 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGCAAATTCTTTCAGGTTGAGTC 56 52 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 GATTCTATGAAGCACTGCTCTTGTTAGGGCTAGTGTTAGTAAATTCTTTCAGGTTGAGTC 658 

Qy 5553 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTAATAGGTAGGGA 5712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 659 TGAGAGCTCACCTACCCATCGGAGCGTAGCTGGAATAGGCTACCAGCTGGTAGGTAGGG- 717 

Qy 5713 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 5772 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 AAACAAAGCTCGAAACAAGCTCAAGTAATAACAACATAATGTGACCATAAAATCTCGTGG 77 7 

Qy 5773 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 5832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 TGTATGAGATACAATTATGTACTTTCCCACAAATGTTTACATAATTAGAATGTTGTTCAA 837 

Qy 5833 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 5892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CTTGCCTAACGCCCCAGCTAGAACATTCAATTATTACTATTACCACTACTAAGGCAGTAT 897 

Qy 5893 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 5952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 GTCCTAACTCGTTCCAGATCAGCGCTAACTTCGATTGAATGTGCGAAATTTATAGCTCAA 95 7 

Qy 5953 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 6012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 958 TATTTTAGCACTTATCGTATTGATTTAAGAAAAAATTGTTAACATTTTGTTTCAGTATGT 1017 

Qy 6013 CGCTTATACAAATGCAAACATCAATGATT 6041 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1018 CGCTTATACAAATGCAAACATCAATGATT 1046 
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